121 research outputs found

    Gestion de la collection photographique des HUG: mise en valeur et pérennisation

    Get PDF
    Ce travail de Bachelor a été réalisé dans le cadre du mandat émis par les HUG en vue d’établir des règles de gestion pour leurs différents fonds photographiques documentaires servant à illustrer leurs diverses documentations (l’imagerie médicale n’est pas traitée dans le contexte du présent travail). Les HUG possèdent une collection photo historique, sous forme analogique, ainsi qu’une collection plus récente sous forme numérique, dans lesquelles il est ardu de repérer les images souhaitées. L’objectif de ce mandat est d’établir des règles claires pour que ces fonds puissent être exploités de manière pérenne. Les principales étapes pour réaliser ce travail ont été : • L’analyse de l’existant en vue de faire un état des lieux des pratiques documentaires des photographies, tant du côté des archives centrales où sont conservées les photos historiques que de celui de la direction de la communication où sont utilisées l’ensemble des images ; • L’étude de la littérature professionnelle, dans le but de cerner l’ensemble des points à considérer lors de la création de règles de gestion ; • L’envoi d’un questionnaire pour obtenir des solutions appliquées concrètement dans d’autres institutions en charge de fonds photographiques ; • La comparaison entre les recommandations théoriques et les applications professionnelles récoltées afin de déterminer les règles applicables aux HUG au vu de l’analyse effectuée ; • La création de livrables – inventaires, protocoles de versement, règles de catalogage, fichiers de contrôle-qualité – pour satisfaire les exigences de mes mandantes ; • La mise à l’épreuve des livrables créés, avec le traitement de trois échantillons, pour ajuster lesdits documents au plus près de la réalité. En réalisant ce mandat, l’importance de ne pas délaisser les fonds photographiques au sein d’une institution a été révélée : si aucune mesure préventive n’est prise, il y a alors de grands risques que ces informations soient perdues dans l’avenir et qu’elles ne puissent pas être réutilisées. La fragilité des supports analogiques qui se détériorent au fil du temps a pu être constatée, d’où la nécessité de prendre le temps de les inventorier et les conditionner correctement. En outre, les photographies numériques représentent d’autres préoccupations, telles que leur format et éventuelle migration, leurs métadonnées à inscrire (où, quand, par qui), leur archivage électronique, etc. Des recommandations sont faites dans le présent document pour réaliser le traitement documentaire des collections – analogique et numérique

    Improving average ranking precision in user searches for biomedical research datasets

    Full text link
    Availability of research datasets is keystone for health and life science study reproducibility and scientific progress. Due to the heterogeneity and complexity of these data, a main challenge to be overcome by research data management systems is to provide users with the best answers for their search queries. In the context of the 2016 bioCADDIE Dataset Retrieval Challenge, we investigate a novel ranking pipeline to improve the search of datasets used in biomedical experiments. Our system comprises a query expansion model based on word embeddings, a similarity measure algorithm that takes into consideration the relevance of the query terms, and a dataset categorisation method that boosts the rank of datasets matching query constraints. The system was evaluated using a corpus with 800k datasets and 21 annotated user queries. Our system provides competitive results when compared to the other challenge participants. In the official run, it achieved the highest infAP among the participants, being +22.3% higher than the median infAP of the participant's best submissions. Overall, it is ranked at top 2 if an aggregated metric using the best official measures per participant is considered. The query expansion method showed positive impact on the system's performance increasing our baseline up to +5.0% and +3.4% for the infAP and infNDCG metrics, respectively. Our similarity measure algorithm seems to be robust, in particular compared to Divergence From Randomness framework, having smaller performance variations under different training conditions. Finally, the result categorization did not have significant impact on the system's performance. We believe that our solution could be used to enhance biomedical dataset management systems. In particular, the use of data driven query expansion methods could be an alternative to the complexity of biomedical terminologies

    La mesure de l’offre et de l’utilisation des ressources numériques dans une sélection de bibliothèques romandes

    Get PDF
    Ce travail a été réalisé en collaboration avec l’Office fédéral de la statistique (OFS), et a comme objectif général de comprendre comment les chiffres fournis par les bibliothèques concernant les ressources numériques ont été construits. L’Office fédéral de la statistique met à disposition du public des statistiques fiables, complètes, transparentes et comparables. Dans son souci de transparence et de fiabilité, elle se trouve confrontée à des problèmes de cohérence lors de la mesure de l’utilisation de ces ressources numériques. En effet, les bibliothèques ont vu leurs pratiques d’achat et de constitution de collections modifiées par l’essor des ressources numériques qui n’appartiennent plus aux bibliothèques, mais dont elles louent un droit d’accès à des tiers à travers des licences d’utilisation. Afin d’avoir un aperçu de ce qui se fait au sein des bibliothèques, ce travail s’attache à décrire et caractériser la mesure de ces ressources numériques selon l’axe de l’offre et de l’utilisation. Pour connaître ce qui se cache derrière les chiffres transmis à l’OFS, une étude de 3 bibliothèques a été réalisée grâce à des entretiens suivis de nombreux mails. Puis une analyse en a été tirée, qui démontre le manque d’exhaustivité manifeste dans les mesures transmises à l’OFS. Des recommandations sont émises, comme la nécessité d’homogénéiser les mesures grâce à des standards comme COUNTER, de mieux définir les rubriques du questionnaire pour aider les bibliothécaires à insérer leurs statistiques dans les bonnes cases, et de concevoir un guide des bonnes pratiques par type de bibliothèque

    Usages attendus et réels d’outils de publication pédagogiques: état des lieux, préconisations et accompagnement au changement

    Get PDF
    Ces dernières années ont vu l’essor considérable du numérique et des technologies bouleverser profondément nos sociétés, notamment les modes de communication, les services ou encore le domaine médical. La sphère scolaire est aussi impactée par cette transformation et doit relever le défi de l’intégration des technologies numériques dans l’enseignement et l’apprentissage. Le Service écoles-médias (SEM), rattaché au secrétariat général du Département de l’instruction publique, de la formation et de la jeunesse (DIP), fournit aux écoles publiques genevoises du primaire et du secondaire le savoir-faire et les ressources permettant l’intégration des technologies et du multimédia pour un usage pédagogique. Le SEM propose ainsi des applications en ligne, comme WordPress, utilisé pour la création des sites web d’établissement, des sites spécialisés (thématiques) et des blogs de classe, mais dont les usages réels ne sont pas précisément connus. C’est dans ce contexte que ce travail de master est réalisé. Il a pour objectifs de déterminer les contenus publiés sur WordPress, d’identifier les usages ainsi que les besoins et les attentes des utilisateurs. Il tient compte en outre du cadre régulatoire en vigueur dans lequel s’inscrit l’utilisation de WordPress. Il résulte que les usages et les contenus diffèrent grandement selon les sites web et les blogs. Des catégories d’information se dégagent des sites d’établissement, dont celles nommées Administratif et Enseignement, qui auraient également besoin de publier des informations non publiques. Les publications sur les blogs concernent quant à elles principalement les activités de la classe, notamment la Production écrite et la Production manuelle. Il ressort en outre que des données personnelles, voire sensibles, et ne relevant pas du pédagogique, sont publiées alors qu’elles ne devraient pas l’être. En revanche, la catégorisation des informations sur les sites spécialisés n’est pas possible car elles ne se ressemblent pas suffisamment. Les résultats démontrent qu’il existe des besoins spécifiquement liés à l’utilisation de WordPress, ce dernier est par ailleurs évalué positivement par les répondants, ainsi que des attentes plus larges qui brassent divers aspects. Ils conduisent à la formulation de recommandations développées en plusieurs axes, dont la communication et sensibilisation ou la mise en place d’un support WordPress, utiles pour initier une démarche d’accompagnement au changement

    Formation d’introduction à la recherche documentaire: état des lieux de la formation dans les bibliothèques académiques en Europe et développement d’un scénario ludique pour les étudiants en première année de Bachelor à l’Université de Neuchâtel

    Get PDF
    Ce travail de bachelor est mandaté par la Bibliothèque de la Faculté des lettres et sciences humaines de l’Université de Neuchâtel. Il a pour objectif de présenter les pratiques en matière de formation à la recherche documentaire en Europe, et de proposer un scénario de formation ludique pour les étudiants en première année de Bachelor de la faculté. Les typologies de formations en bibliothèque se diversifient en utilisant les innovations faites dans les domaines de la pédagogie et des technologies. Toutefois, la Suisse et l’Europe en générale, ont encore beaucoup à apprendre des bibliothèques anglo-saxonnes. En effet, très peu d’institutions proposent des formations aux compétences informationnelles pour chaque niveau du cursus académique, et pour la grande majorité, ces formations sont facultatives. Le service Info@doc de la Faculté des lettres et sciences humaines, donne aux étudiants de la faculté, un cours d’introduction à la recherche documentaire à la demande des enseignants. Afin de rendre la formation plus interactive, dix jeux courts reprenant les étapes de la recherche documentaire sont proposés. Pour chacun, des objectifs pédagogiques, les règles du jeu, ainsi que des exemples sont spécifiés. Cette boîte à jeux renforce le dynamisme des formations, et permet une approche plus détendue

    Gene Ontology density estimation and discourse analysis for automatic GeneRiF extraction

    Get PDF
    <p>Abstract</p> <p>Background</p> <p>This paper describes and evaluates a sentence selection engine that extracts a GeneRiF (Gene Reference into Functions) as defined in ENTREZ-Gene based on a MEDLINE record. Inputs for this task include both a gene and a pointer to a MEDLINE reference. In the suggested approach we merge two independent sentence extraction strategies. The first proposed strategy (LASt) uses argumentative features, inspired by discourse-analysis models. The second extraction scheme (GOEx) uses an automatic text categorizer to estimate the density of Gene Ontology categories in every sentence; thus providing a full ranking of all possible candidate GeneRiFs. A combination of the two approaches is proposed, which also aims at reducing the size of the selected segment by filtering out non-content bearing rhetorical phrases.</p> <p>Results</p> <p>Based on the TREC-2003 Genomics collection for GeneRiF identification, the LASt extraction strategy is already competitive (52.78%). When used in a combined approach, the extraction task clearly shows improvement, achieving a Dice score of over 57% (+10%).</p> <p>Conclusions</p> <p>Argumentative representation levels and conceptual density estimation using Gene Ontology contents appear complementary for functional annotation in proteomics.</p

    Multilingual RECIST classification of radiology reports using supervised learning.

    Get PDF
    OBJECTIVES The objective of this study is the exploration of Artificial Intelligence and Natural Language Processing techniques to support the automatic assignment of the four Response Evaluation Criteria in Solid Tumors (RECIST) scales based on radiology reports. We also aim at evaluating how languages and institutional specificities of Swiss teaching hospitals are likely to affect the quality of the classification in French and German languages. METHODS In our approach, 7 machine learning methods were evaluated to establish a strong baseline. Then, robust models were built, fine-tuned according to the language (French and German), and compared with the expert annotation. RESULTS The best strategies yield average F1-scores of 90% and 86% respectively for the 2-classes (Progressive/Non-progressive) and the 4-classes (Progressive Disease, Stable Disease, Partial Response, Complete Response) RECIST classification tasks. CONCLUSIONS These results are competitive with the manual labeling as measured by Matthew's correlation coefficient and Cohen's Kappa (79% and 76%). On this basis, we confirm the capacity of specific models to generalize on new unseen data and we assess the impact of using Pre-trained Language Models (PLMs) on the accuracy of the classifiers

    Automatic medical encoding with SNOMED categories

    Get PDF
    BACKGROUND: In this paper, we describe the design and preliminary evaluation of a new type of tools to speed up the encoding of episodes of care using the SNOMED CT terminology. METHODS: The proposed system can be used either as a search tool to browse the terminology or as a categorization tool to support automatic annotation of textual contents with SNOMED concepts. The general strategy is similar for both tools and is based on the fusion of two complementary retrieval strategies with thesaural resources. The first classification module uses a traditional vector-space retrieval engine which has been fine-tuned for the task, while the second classifier is based on regular variations of the term list. For evaluating the system, we use a sample of MEDLINE. SNOMED CT categories have been restricted to Medical Subject Headings (MeSH) using the SNOMED-MeSH mapping provided by the UMLS (version 2006). RESULTS: Consistent with previous investigations applied on biomedical terminologies, our results show that performances of the hybrid system are significantly improved as compared to each single module. For top returned concepts, a precision at high ranks (P0) of more than 80% is observed. In addition, a manual and qualitative evaluation on a dozen of MEDLINE abstracts suggests that SNOMED CT could represent an improvement compared to existing medical terminologies such as MeSH. CONCLUSION: Although the precision of the SNOMED categorizer seems sufficient to help professional encoders, it is concluded that clinical benchmarks as well as usability studies are needed to assess the impact of our SNOMED encoding method in real settings. AVAILABILITIES : The system is available for research purposes on: http://eagl.unige.ch/SNOCat

    Khresmoi Professional: Multilingual Semantic Search for Medical Professionals

    Get PDF
    There is increasing interest in and need for innovative solutions to medical search. In this paper we present the EU funded Khresmoi medical search and access system, currently in year 3 of 4 of development across 12 partners . The Khresmoi system uses a component based architecture housed in the cloud to allow for the development of several innovative applications to support target users medical information needs. The Khresmoi search systems based on this architecture have been designed to support the multilingual and multimod al information needs of three target groups the general public, general practitioners and consultant radiologists. In this paper we focus on the presentation of the systems to support the latter two groups using semantic, multilingual text and image based (including 2D and 3D radiology images) search
    corecore